Abstract
语义词空间很有用,但是没有办法表达长词组的意思。提出了Recursive Neural Tensor Network
,这个模型可以捕捉到否定词的影响。
Introduction
现有的模型难以学习组合词语,这是由于缺乏标注好的组合词词库。Stanford Sentiment Treebank
是第一个在语法树上带标注的语料库。
Related Work
涉及到了五个方面的工作
- Semantic Vector Spaces
- Compositionality in Vector Spaces
- Logical Form
- Deep Learning
- Sentiment Analysis
Stanford Sentiment Treebank
之前用的最多的是Bag of words classifiers
但是这个对于单个句子的情感分析准确率从没超过80%。在像对twitter这样的短文本进行分析的时候,准确率也通常不到60%。
他们观察到长的短语通常容易包含情感,越短包含的越少。